Une méthode d'extraction d'information fondée sur les graphes pour le remplissage de formulaires (A Graph-Based Method for Template Filling in Information Extraction) [in French]
نویسندگان
چکیده
A Graph-Based Method for Template Filling in Information Extraction In event-based Information Extraction systems, a major task is the automated filling from unstructured texts of a template gathering information related to a particular event. Such template filling may be a hard task when the information is scattered throughout the text and mixed with similar pieces of information relative to a different event. We propose in this paper a two-step approach for template filling : first, an event-based segmentation is performed to select the parts of the text related to the target event ; then, a graph-based method is applied to choose the most relevant entities in these parts for characterizing the event. Using an evaluation of this model based on an annotated corpus for earthquake events, we achieve a 72% F-measure for the template-filling task. MOTS-CLÉS : Extraction d’information, segmentation de texte, remplissage de formulaires.
منابع مشابه
Méthode pour la modélisation du contexte d'interaction
RÉSUMÉ. Cet article s’inscrit dans le domaine de l’informatique ambiante et propose une définition opérationnelle du contexte d’interaction pour les besoins de l’interaction hommemachine. Après un bilan sur la notion de contexte dans la littérature, nous présentons notre définition du contexte fondée sur des réseaux de contextes et de situations puis une méthode d’analyse s’appuyant sur cette d...
متن کاملCorrection de formulaires basée sur des machines pondérées à états finis Correction de formulaires basée sur des machines pondérées à états finis
Résumé : Pour être rendue plus démocratique, surtout dans les applications industrielles, la reconnaissance de caractères manuscrits a besoin d’atteindre de très hauts taux de reconnaissance. Pour cela, une correction dédiée à un problème particulier le permet de manière efficace, en modélisant l’information a priori disponible. Dans ce papier, nous présentons une méthode complète de compréhens...
متن کاملExtraction sous contraintes d'ensembles de cliques homogènes
Résumé. Nous proposons une méthode de fouille de données sur des graphes ayant un ensemble d’étiquettes associé à chaque sommet. Une application est, par exemple, d’analyser un réseau social de chercheurs co-auteurs lorsque des étiquettes précisent les conférences dans lesquelles ils publient. Nous définissons l’extraction sous contraintes d’ensembles de cliques tel que chaque sommet des clique...
متن کاملPrédiction de liens temporels en intégrant les informations de contenu et de structure
RÉSUMÉ. Dans cet article nous traitons le problème de la prédiction de liens temporels, qui consiste à prédire l’apparition des nouveaux liens dans des graphes de données dynamiques. Cette tâche apparaît dans les applications telles que la recommandation ou l’analyse des réseaux sociaux. La plupart des approches de prédiction de liens temporels se basent uniquement sur la structure topologique ...
متن کاملReprésentation sémantique de questions pour interroger le Web sémantique
RÉSUMÉ. Les bases de connaissances du Web sémantique sont généralement représentées sous forme de triplets RDF formant un graphe. Leur interrogation passe par un langage de type SPARQL, langage non maîtrisé des utilisateurs non experts, qui requiert de connaître le schéma de la base. C’est pourquoi les systèmes d’interrogation en langage naturel se développent actuellement. Se pose alors le pro...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید
ثبت ناماگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید
ورودعنوان ژورنال:
- TAL
دوره 54 شماره
صفحات -
تاریخ انتشار 2012